dARK - Decentralized Archival Resource Key

A decentralized implementation of the ARK persistent identifier

  • O que é dARK

    dARK é uma implementação descentralizada do Archival Resource Key (ARK) que atribui e resolve identificadores ARK através de nós blockchain institucionais. Opera em uma rede de "bem público" onde a propriedade, armazenamento e controle dos dados são distribuídos entre todas as organizações participantes.

    O projeto inicial foi principalmente hospedado e financiado pelo Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), com apoio adicional da LA Referencia, possibilitado graças ao suporte das contribuições da Global Sustainability Coalition for Open Science Services (SCOSS).

    Descentralização

    Uma implementação inicial do ARK descentralizado baseada em uma rede blockchain privada leve

    Tolerância a Falhas

    Atribuição e resolução descentralizada tolerante a falhas de identificadores ARK através de uma rede distribuída

    Integração

    Um sistema de atribuição ARK em nível de agregador para produção de pesquisa legada no ecossistema brasileiro de ciência aberta (OasisBr, IBICT Brasil)

    Motivações

    Identificador Persistente ARK

    O identificador ARK surgiu como uma alternativa viável e de baixo custo devido à possibilidade de implementar provedores locais para o resolvedor global. Seu uso facilita o acesso e preservação de longo prazo de recursos digitais, garantindo links estáveis e confiáveis.

    Avaliação de Pesquisa

    Identificadores persistentes são essenciais para construir grafos de pesquisa mais robustos, gerar indicadores precisos e melhorar a avaliação da produção científica. Sua capacidade de vincular vários objetos de informação aprimora a análise e compreensão do impacto da pesquisa.

    Desafios no Sul Global

    Nos países do Sul Global, a falta de cobertura de identificadores persistentes é um problema comum. Isso se deve principalmente aos custos associados a esses serviços, limitando o acesso a infraestruturas essenciais para garantir a visibilidade e preservação dos resultados de pesquisa.

    Necessidade de Descentralização

    Atualmente, a maioria dos sistemas de identificadores persistentes opera sob modelos centralizados, dependendo de algumas agências para manter a infraestrutura de serviço. Uma abordagem descentralizada, como a proposta pelo dARK, reduz essa dependência e aumenta a resiliência do sistema, promovendo maior equidade no acesso e gestão dos identificadores.

    Objetivos de Longo Prazo

    Infraestrutura Aberta

    Fornecer um sistema aberto e não centralizado para identificadores persistentes únicos/desduplicados acessível a todos

    Serviços de Resolução

    Oferecer um serviço de resolução descentralizado para o ecossistema de Ciência Aberta, interoperável com outros serviços de PID (como agências DOI)

    Preservação de Metadados

    Garantir a preservação descentralizada dos metadados associados aos objetos digitais referenciados pelos identificadores ARK, visando fornecer PIDs e metadados consistentes para grafos de pesquisa (OpenAIRE, OpenAlex, entre outros)

    Nota Importante

    Este desenvolvimento não pretende substituir ou competir com identificadores/agências DOI, mas servir como uma solução complementar que também será interoperável com provedores DOI.

    more
  • Arquitetura e Componentes

    A arquitetura do sistema dARK é projetada com uma clara separação de componentes, organizados na Camada de Serviço e na Camada Core.

    Diagrama de Arquitetura dARK

    Camada de Serviço

    A Camada de Serviço fornece serviços essenciais que interagem com os componentes da Camada Core. Estes serviços incluem:

    dARK Resolver

    Integrado com o sistema global de resolução nt2.info, permitindo a resolução de identificadores persistentes

    dARK Minter

    Utilizado para criar e registrar novos PIDs no sistema

    dARK Dashboard

    Fornece capacidades de monitoramento e administração para a plataforma

    Acessar o código fonte no GitHub

    dARK API

    Facilita a comunicação entre aplicações e o blockchain subjacente

    dARK Backup

    Garante a durabilidade dos dados e a confiabilidade do sistema

    Acessar o código fonte no GitHub

    dARK LA Referencia

    Implementa a criação massiva de dARK na Plataforma de Colheita da LA Referencia

    Estes serviços são apoiados por mecanismos de balanceamento de carga para garantir alta disponibilidade e um desempenho ótimo do sistema.

    Camada Core (dARK dApp)

    A Camada Core é construída sobre uma rede blockchain com permissões que forma a coluna vertebral do sistema dARK. Em seu núcleo está uma rede pública com permissões que opera com um mecanismo de consenso de Prova de Autoridade (PoA), proporcionando tanto segurança quanto eficiência para a gestão de PIDs.

    Sobre a maturidade do código aberto dARK

    dARK é um projeto de código aberto e está disponível para a comunidade global de Ciência Aberta. No entanto, é um projeto em constante evolução, teste e melhoria. Portanto, não recomendamos criar implementações de produção baseadas em dARK neste momento. Estamos abertos a contribuições de código e testes em ambientes piloto, e encorajamos a participação da comunidade através desses canais.

    dARK dApp

    Aplicação descentralizada central que implementa os contratos inteligentes de gestão de PIDs e garante a integridade dos dados através da tecnologia blockchain

    Fundação Blockchain

    A rede aproveita a tecnologia Hyperledger Besu para fornecer uma base blockchain segura e eficiente. Hyperledger Besu é um cliente Ethereum projetado para uso empresarial que suporta implementações de redes públicas e privadas com permissões. Sua implementação da Máquina Virtual Ethereum (EVM) permite contratos inteligentes sofisticados que gerenciam operações de PID com total transparência e auditabilidade.

    Arquitetura da Rede

    Projetada com a resiliência e a confiabilidade como princípios fundamentais, a arquitetura começa com uma Rede dARK Mínima Viável (MVDN). Esta rede consiste em nós blockchain essenciais que fornecem a funcionalidade fundamental necessária para a operação do sistema. Estes nós gerenciam as comunicações RPC/API e mantêm o livro-razão distribuído de identificadores persistentes. Cada nó completo implementa endpoints de API para a interação de serviços externos através de balanceamento de carga.

    Para garantir a operação contínua mesmo durante falhas de nós, a arquitetura incorpora redundância tolerante a falhas através de nós de backup e sistemas de replicação de dados. Esta abordagem distribuída assegura que nenhum ponto único de falha possa comprometer a integridade ou disponibilidade da infraestrutura de PID.

    Camada de Aplicação

    Na camada de aplicação, o dARK dApp oferece a funcionalidade central para gerenciar identificadores persistentes através de contratos inteligentes. Esta lógica de aplicação gerencia a criação, atualização e resolução de PIDs enquanto aplica as regras de governança definidas pelos participantes da rede.

    Infraestrutura Federada

    A arquitetura suporta múltiplas redes blockchain independentes operadas por diferentes autoridades, criando uma infraestrutura de PID verdadeiramente federada.

    Design Escalável

    O sistema pode escalar horizontalmente adicionando mais nós à rede, assegurando um alto desempenho mesmo com um número crescente de PIDs.

    Extensões Futuras

    O design modular permite a incorporação futura de soluções de armazenamento adicionais como IPFS para cargas de metadados maiores, mantendo a integridade dos dados através da verificação criptográfica na cadeia.

    Integração do Ecossistema

    O sistema dARK é projetado para se integrar perfeitamente com o ecossistema acadêmico existente, particularmente com redes de repositórios, revistas diamond e agregadores de metadados, seguindo este fluxo de trabalho inicial:

    1

    Colheita de Metadados

    Os agregadores coletam regularmente metadados de repositórios institucionais, revistas e outros provedores de conteúdo através de protocolos padrão como OAI-PMH ou APIs personalizadas.

    2

    Atribuição de PID

    Para conteúdo sem identificadores persistentes, o agregador pode solicitar novos ARKs através da API do dARK Minter. Para ARKs existentes, são validados e registrados no sistema dARK.

    3

    Registro no Blockchain

    O sistema dARK registra cada ARK no blockchain, junto com sua URL de destino e metadados essenciais, proporcionando um registro descentralizado e à prova de manipulações de identificadores.

    4

    Distribuição de PID

    Os ARKs recém-criados ou validados podem ser enviados de volta aos repositórios para inclusão em seus registros de metadados, permitindo uma abordagem padronizada para a identificação persistente em toda a rede.

    5

    Resolução

    Quando um usuário acessa um ARK, o resolver global redireciona para o resolver dARK, que utiliza o blockchain para recuperar a informação de localização atual, assegurando o acesso persistente mesmo quando as localizações dos recursos mudam.

    Esta abordagem de integração permite aos agregadores de metadados como LA Referencia melhorar seus serviços com uma infraestrutura de PID descentralizada enquanto preservam os fluxos de trabalho existentes e adicionam valor à rede de repositórios como um todo. Também permite transições sem problemas quando os repositórios movem conteúdo ou mudam de plataforma, já que o sistema de resolução de PID pode ser atualizado sem quebrar links externos.

    Desenvolvimento Futuro

    Nas próximas fases de desenvolvimento, o projeto dARK planeja:

    • Transformar este projeto inicial (atualmente trabalhando no IBICT/Brasil) em um serviço regional integral projetado como uma infraestrutura pública, seguindo os princípios estabelecidos pela LA Referencia
    • Desenvolver plugins para os sistemas de repositórios e revistas mais utilizados para facilitar a integração perfeita com a infraestrutura dARK
    • Implementar persistência descentralizada de metadados para preservar a informação bibliográfica e servir como uma fonte de dados confiável para sistemas analíticos como OpenAlex

    Essas melhorias fortalecerão ainda mais o ecossistema dARK e expandirão sua utilidade dentro do panorama da comunicação acadêmica em toda a América Latina e além.

    more